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В работе представлены результаты исследования эволюционно-фрагментарной модели для поиска 
оптимальной классификации. Показано, что задача поиска оптимальной классификации на конечном 
множестве может рассматриваться как задача на фрагментарной структуре. Предложена ЭВОЛЮЦИоОННо- 
фрагментарная модель задачи классификации на множестве перестановок. 

Ключевые слова: задача классификации, фрагментарная структура, эволюционная модель. 


КезеагсН гези 5 суо[айопаШу Назтете4 тоде! {0 Нпа Фе орйта! с!а551Ясайоп ргеземе4 ш Фе угогК. 
[ Баз зво\уп Фа фе ргоет оЁ Нпате ап орйтла] <азз1сайоп оп а АпНе зе сопз14еге4 аз а сваЙепзе Юг фе 
Пастлеге4 збасйте. Ап еуолбопаШу Навтеше то4е| ог Фе ргоШетл о с1аззсайоп оп а зеё оЁ 
репищавопз 1$ ргорозеа. 

Кеу мог@$: Саззсаноп рго ет, Настпеме4 згасвте, еуоиНопагу тоде|. 


У робот! представлено результати досллдження еволющйно-фрагментарно! модел! для пошуку 
оптимально! класифижацй. Показано, що задача пошуку оптимально! класифткацй на кнцевй множин! 
може розглядатися як задача на фрагментарн й структур!. Запропоновано еволюцщно-фрагментарну 
модель задач! класиф\каци на множин! перестановок. 

Ключов! слова: задача класифткаци, фрагментарна структура, еволющйна модель. 


Введение 


Одной из основных задач исследования операций является задача классифи- 
кации. Этой задаче посвящены многочисленные публикации[1-3]. Известны много 
подходов к поиску решения задачи классификации на конечных множествах. Тем 
не менее, говорить сегодня о том, что эта задача исследована полностью еще рано. 
В этой статье мы не будем обсуждать принципы выбора классификации, которые 
относятся большей частью к области теории принятия решений. Речь пойдет лишь 
об одной постановке этой задачи, основанной на минимизации диаметров класте- 
ров — элементов классификации [2]. Как известно, эта задача относится к числу МР 
— полных задач [4]. Точный алгоритм полиномиальной трудоемкости для поиска 
оптимальной классификации неизвестен. 

Для поиска решения этой задачи часто используются эвристические 
алгоритмы [5]. В работе предлагается метод, основанный на комбинации 
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эволюционного и фрагментарного алгоритмов. Подобная технология показала 

хорошие результаты для ряда сложных дискретных оптимизационных задач [6-7]. 
Постановка задачи. Рассмотрим задачу классификации в следующей 

постановке: задано конечное множество объектов Х = {х,х.,....ху). Определена 


мера различия между объектами. Эта мера задается матрицей Р = {а,} _ ‚1: Причем 
4,>0, а,=а,, 4,=0, 1/=12,...,М. Каждый элемент матрицы 4, определяет 


различие между соответствующими объектами. Задача классификации состоит в 
разбиении множества объектов на К непустых попарно непересекающихся классов 


ое я 


Диаметром класса Х„ будем называть число 0, = шах а, $5=1,2,...,К. 


х.х,ЕХ, 
Оптимальной классификацией называется такое разбиение множества Х, при 


котором величина Д= шах д, минимальна. Величину Д будем называть 
5=1,2,..К ‘ 


диаметром разбиения. 
В [4] доказано, что задача классификации в приведенной выше постановке 
является МР-полной. 


Фрагментарная структура 


В соответствии с [8] упорядоченной фрагментарной структурой (Х,Е) на 
конечном множестве Х называется семейство его упорядоченных подмножеств 
Е={Е,Е,,....Е„} такое, что 

УЕеЕ, Е, *©, Е, ={х,х,,...х,}, У5 ЗК, {хьх,,..х,} ЕЕ. 

Простым, но достаточно общим примером фрагментарной структуры могут 


служить ориентированные пути в ориентированном корневом дереве. На рис.1 
показано ориентированное дерево с семью дугами и наборы путей, образующих 


упорядоченную фрагментарную структуру 


В Е =; р = {х.}; т. = р 
х /х\ ж / ха Е. ={х,х,}; Е = {хх}; В = хз; 
Х7 Е. = {х.,х}; и. = („хм }; 


Рис.1 Ориентированное дерево и соответствующая ему фрагментарная структура 


Элементы множества Ё называются допустимыми фрагментами. Одно- 
элементные множества, которые являются допустимыми фрагментами, будем 
называть элементарными фрагментами. Фрагмент называется максимальным, если он 
не является подмножеством никакого другого фрагмента. Всякий допустимый 
фрагмент можно построить из пустого множества, последовательно добавляя к нему 
элементы так, чтобы на каждом шаге такой процедуры полученное подмножество 
было допустимым фрагментом. 

Максимальный фрагмент может быть построен с помощью фрагментарного 
алгоритма: 

а) элементы множества Х линейно упорядочиваются; 
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6) на начальном шаге выбирается пустое множество Ху = ©; 
в) на шаге с номером А+1 выбирается первый по порядку элемент хе Х \Х,, 
такой, что Х, 4х} е Е; 


Г) алгоритм заканчивает работу, если на очередном шаге не удалось найти 
элемент хе Х \ Х, стребуемым свойством. 


Результат применения фрагментарного алгоритма определяется заданным 
линейным порядком на множестве Х. Таким образом, любой максимальный фрагмент 
может быть описан некоторой перестановкой элементов множества Х. 

Пусть теперь каждому максимальному фрагменту приписано неотрицательное 
число — вес фрагмента. Тогда возникает естественное отображение множества 
перестановок во множество весов, которое каждой перестановке 5е5, ставит в 


соответствие неотрицательное число — вес максимального фрагмента, который 
определяется перестановкой 5 элементов базового множества Х. 

Покажем, что задача классификации на конечном множестве Х’ объектов в 
приведенной выше постановке может быть сведена к задаче поиска максимального 
фрагмента упорядоченной фрагментарной структуры с минимальным весом. 
Элементарными фрагментами этой структуры будут все одноэлементные 
подмножества множества Х. 

Упорядочим элементы множества Х в определенном порядке (х,,х.,.... ху). С 


каждым таким упорядочением связано С» \ различных разбиений множества Х на А 


непустых попарно непересекающихся подмножеств. Каждое такое разбиение О 

определяется выбором (-1 границ из --1 возможных между элементами множества 

Х, выстроенных в заданном порядке: 
ХХ, +55, | ХунзХ х 


о Ло 


[5х 


512 951423" Хм. 
Построение каждого такого разбиения осуществляется алгоритмом константной 


трудоемкости. Поставим в соответствие каждому разбиению О его диаметр До. Из 


всех разбиений, соответствующих заданному порядку на множестве Х` выберем то, 
диаметр которого минимален (если таких разбиений несколько, то выбираем одно 
из них по детерминированному правилу). Таким образом, с каждой перестановкой 
элементов связана некоторая классификация элементов множества Х. При заданной 


матрице Д= {а} ‚„: различий между элементами множества Х’ трудоемкость 


> К+1 
алгоритма отыскания этой классификации есть О(М№М“”). Максимальным 


фрагментом в рассматриваемом случае является любое линейное упорядочение 
множества Х. Число таких упорядочений есть Л! и потому задача перебора всех 
фрагментов является трудной. Для быстрого поиска классификаций, которые близки к 
оптимальной, предлагается следующая стандартная эволюционная модель на 
фрагментарной структуре. 


Эволюционная модель 


Основные составляющие эволюционной модели следующие [9-11]: 
- базовое множество решений — множество допустимых решений Г, на котором 
ищется оптимальное решение задачи; 
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- оператор построения начальной популяции: процедура, которая позволяет 
выделить на множестве всех допустимых решений его подмножество ИСУ для 
последующей эволюции; 

- критерий селекции — алгоритм вычисления значения по целевой функции по 
заданной перестановке на элементах базового множества решений, который позволяет 
упорядочивать решения в рамках заданной популяции; 

- оператор кроссовера К:Г/хГ >71, позволяющий по двум допустимым 
решениям-родителям построить новое решение-потомок из множества допустимых 
решений; 

- оператор мутации М :Г >И; 

- оператор отбора, который выделяет множество пар в И’ для выполнения 
операции кроссовера; 

- оператор эволюции, позволяющий строить новые популяции из множества 
родителей и потомков; 

- правило остановки, которое определяет условие остановки эволюционного 
алгоритма. 

Опишем кратко принцип работы эволюционного алгоритма. На начальном шаге 
с помощью оператора начальной популяции строится множество решений И’. На 
каждом очередном шаге предполагается заданным некоторое множество допустимых 
решений - текущая популяция. На первом шаге это множество И’ = И. Для каждого 


из элементов множества И’ вычисляется значение целевой функции. Далее с помощью 
оператора отбора в текущей популяции И’ выбирается множество пар для кроссовера. 
К каждой паре из выбранного множества пар применяется оператор кроссовера, а 
затем к результату кроссовера применяется оператор мутации. Таким путем находится 


множество элементов — потомков И’. 


К промежуточной популяции И’ й, которая является объединением текущей 
популяции и множества потомков, применяется оператор эволюции, который 
выделяет на этом множестве новую текущую популяцию. Процесс эволюции 
повторяется до тех пор, пока не будет выполнено условие остановки эволюционного 
алгоритма. 

Эволюционно-фрагментарный алгоритм (ЭВФ-алгоритм) является комбинацией 
эволюционного и  фрагментарного алгоритма. Опишем соответствующую 
эволюционную модель и принцип действия такого алгоритма. 

В качестве множества допустимых решений рассматривается подмножество 
максимальных фрагментов на заданной упорядоченной фрагментарной структуре. 
Каждый фрагмент из этого множества определяется соответствующим линейным 
упорядочением элементов множества Х. Таким образом, любому допустимому 
решению соответствует определенная перестановка чисел 1,2,..., №, где \№-количество 
элементарных фрагментов. Для максимального фрагмента определено значение 
критерия селекции. 

Базовое множество ТГ эволюционной модели — это множество 
5 = {1,,....1,} всех перестановок чисел 1,2,...,М. Оператор построения начальной 
популяции выделяет подмножество заданной мощности О из множества Г. 

Критерий селекции устроен следующим образом: по заданной перестановке 
фрагментов с помощью фрагментарного алгоритма строится максимальный допусти- 
мый фрагмент. Вычисляется значение целевой функции задачи для этого фрагмента. 
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Опишем теперь оператор кроссовера. Пусть и = (и, и,,...иу)иу= (У, у,,...,Ух) 


—две произвольные перестановки. Перестановка - потомок строится следующим 
образом: последовательности и и у просматриваются с начала. На т-м шаге 
выбирается наименьший из первых элементов последовательностей и добавляется в 
новую перестановку - потомок. Затем этот элемент удаляется из двух 
последовательностей-родителей. Например, 

К((3,2,8,6,5,1,4,7),(4,7,2,5,1,6,8,3)) = (3,2,4,7,5,1,6,8) 

Оператор мутации М выполняет случайную транспозицию (замену местами двух 
элементов) в перестановке. 

Оператор селекции выбирает случайным образом набор пар из заданного числа 
пар во множестве перестановок текущей популяции. 

Оператор эволюции элементы промежуточной популяции упорядочивает в 
последовательность по убыванию значения критерия селекции. В качестве новой 
текущей популяции выбираются первые О элементов последовательности. 

Обычное правило остановки - количество поколений достигло предельной 
границы Г. Лучшая по значению критерия селекции перестановка из последней 
построенной популяции определяет приближенное решение задачи. 

Предложенный подход является универсальным и позволяет применять один и 
тот же эволюционный алгоритм к любой оптимизационной задаче на конечной 


фрагментарной структуре. 


Результаты тестирования 


Рассмотренный выше метод был применен к задаче разбиения множества точек на 
плоскости на заданное количество классов. Мерой близости точек являлось обычное 
эвклидово расстояние. Входными параметрами при описании серии случайных задач 
являются: число точек плоскости №; диапазоны изменения координат [0, 4],[0, В]. 


С помощью генератора случайных чисел генерируется наборы точек 
(х,х,,...хы), х,=(а,,6,), а, Е[0, 4], ®[0,В], 1=1,2,..,М№М. Число точек М 


выбиралось в промежутке 300-1000, число классов -10. Параметры эволюционного 
алгоритма: Размер популяции -1000, количество поколений-500, 30 пар для селекции в 
каждом поколении, вероятность мутации - 0,05. 

Для поиска решений использовалась авторская программа, реализующая 
эволюционную модель на перестановках. Программа написана на УВА, под 
управлением \/ПМРО\!$ ХР/7. Вычисления проводились на компьютере АСР[х64-Базед 
РС с процессором 4х3400 МН?7. Время расчета для каждой индивидуальной задачи 
было ограничено одной минутой. 

Сравнивались решения, полученные иерархическими  аггломеративными 
методами [12] с решениями, полученным путем применения ЭВФ алгоритма. В серии из 
1000 случайно сформированных задач в 98% случаев лучшей оказывалась 
классификация, полученная с помощью ЭВФ алгоритма. 


Выводы 


Теоретические результаты и результаты численных экспериментов показывают, 
что ЭВФ - алгоритм может достаточно эффективно использоваться как эвристический 
алгоритм при решении задачи классификации. ЭВФ-алгоритм является управляемым, 
качество его работы может возрастать при изменении ряда параметров алгоритма, таких 
как величина популяции, число пар для селекции, количество поколений, количество 
ЭВОЛЮЦИЙ И Т.Д. 
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КЕЗОМЕ 
Г.У. Кот 
Еуош@опагу а]хог1т ОГ Пе орйта| с1а5$Шсайоп 

Тре агасе 415си$зез а Кпо\и ргоет - Фе ргоет оЁ орйта! с1аззШсайоп. ТЫ5 
ргоет оссиг$ ш тапу аррПсаНоп$ ш епотееппе ап есопописз. [ 15 Кпо\’п фа т 1108 
сазез Ше с1аззШсайоп рго ет оп а Нпие её 15 МР-Вага. Рог зисВ ргоетл$ 1юдау аге по! 
Кпо\уп ро]упопиа сотрМехйу а|еогИйтз Юг Ипаше зойоп$. ТВегеЮге, ш ап орла! 
Саззсайоп 15 лазиНе4 изе оР теаВеинзИс$. ТВе шша| дайа оЁ Фе ргоМет отуеп Фе 
ргохиайу таблх Бебмееп еетеп оЁ Ше 5е Шен деегпитез Ше 4еотее оЁ зпиЙагиу 
Бебмееп Шезе еетеп. ТНе питбег оЁ с1а55е$ 15 сопз1егед 1ю Бе зресеа. Те стцепоп Юг 
СазШИсаной 1$ Ше отеа{езё диаШу ог Ше Фатеег$ оЁ с1а5$ез. То па Ше арргохипае 
орйтла] с1аззсайоп 15 ргорозе4 ‘0 изе еуо|иНопагу ап4 Настете4 тоде]. Т№1$ плоде! Ваз 
ууогкеа уе шт Нидте орётла| зоайоп$ ю тапу ЧИси ргоепаз оЁ Ф1зсгее орнпихайоп. 

Тре ага е шбо4исез Фе сопсерё оЁ деа|-опеме4 Настетме4 збтасвге. К 4езстез 
Паотлеще4 а|еогйрил а{ аЦо\уз Юг а отуеп ог4ег оР @ететагу Кате ю БиЙА Фе 
тахипит аПо\уаЫе Насте оГа Яаотлещед эгас@те. 

[6 15 $по\’п Фа Фе ргоет оЁ орштла| с1азз1Ясайоп тау Бе ргеземе4 аз а ргоМет оЁ 
орйптханоп оп а Настете4 зёгасвхте. Т|1$ гедисез Фе ргоШет ю фе орниитайоп ргоМет 
оР Ни4ше ап ор@та| зо[абоп оЁ а сотЬтаюпа| ргоМет оп Ше $её оЁ репишайопв. 
Еуоанопагу агог ит 1$ ргорозеа, Юг умер йе Базе зеё - Ше её оЁ ретишайоп$ оЁ 
@ететагу Наотет. Матепса!| ехрегилеп® оп а Тагое пипабег оЁе3ё ргоепаз зво\уе4 ве 
еНесйуепезз оЁ Фе ргорозе4 арргоасН г Ниде арргохипае зоайопз$ оЁ Фе ргоМет оЁ 
орйтла] с1азЯсаноп. 


Т.В. Козн 
Еволющйний алгоритм оптимально! класифжкаци 

У статт! розглянуто в1дому проблему -— задачу оптимально! класифткаци. Ця 
задача зустрачаеться в численних застосуваннях у технщ! та економщи. В!домо, 
що в Ольшост! випадкв задача класиф\каци на скинченый множин! е МР-важкою. 
Для таких задач на съогодниинйй день нев1дом! алгоритми поллном1ально! трудо- 
м1сткост! для пошуку ришення. Тому в задачах оптимально! класифткаци виправ- 
дане застосування метаевристик. Як вихдн! дан! задач, задано матрицю близь- 
кост! мж елементами множини, яка визначае стушнь схожост! цих елементив. 
Кльюксть класв вважаеться заданим. Критер1ем якост! класифткаци е найб1льший 
з даметрв класв. Для пошуку наближено! оптимально! класифкаци запропо- 
новано використовувати еволющйно-фрагментарну модель. Ця модель добре 
зарекомендувала себе при пошуку оптимальних ришень багатьох важких задач 
дискретно! оптим1заци. 

У статт! докладно представлено концепщю ор!ентовано! фрагментарно! 
структури. Наведено фрагментарний алгоритм, який дозволяе для заданого поряд- 
ку елементарних фрагментв побудувати максимально допустимий фрагмент 
фрагменттарно! структури. Показано, що задача оптимально! класифлкащя може 
бути представлена як задача оптимзаци на фрагментарно] структури. Це дозволяе 
звести задачу оптим1-зацй до задач1 пошуку оптимального рипення комб1наторнот 
задач1 на множин! перестановок. Запропоновано еволющйний алгоритм, для 
якого базова множина — множина перестановок елементарних фрагментив. 
Чисельний експеримент на велиюмй к!лькост! тестових задач показав ефективнисть 
пропонованого шдходу для пошуку наближеного ришення задач! оптимального 
класифткаци. 
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